拍拍贷业务探索

by赵亚楠

摘要

数据主要来自于拍拍贷的标的特征数据,标的还款计划和还款记录,以及客户的投资记录。 而lcis数据中包含lc数据的所有21个字段,因为数据量的原因, 本次分析仅选择对lcis中的数据进行探索性分析。主要分析思路包含: * 对所有的变量进行分布分析 * 对使用拍拍贷的用户进行人口统计学分析,这里仅包含用户的年龄和性别。 * 对于拍拍贷的借款类型分类。 * 对于拍拍贷业务中的首拍比例进行分析。 * 拍拍贷的借款金额情。 * 借款利率分析,与借款金额,借款时间及用户评级之间是否存在联系。 * 用户的评级和用户预期还款,借款利率的关系

## [1] "C:/Users/Administrator/Downloads/ppdai_3_23"

Univariate Plots Section

对年龄进行探索,探索年龄的分布情况

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   18.00   25.00   28.00   29.35   32.00   65.00

  • 从年龄的分布来看,年龄呈偏态分布,更多的集中在低年龄阶段。
  • 从summary可以看出,年龄的平均值在29.35,中值为28,而75%分位值为32.中间50%的 人数集中在25-32岁之间。

借款金额探索性分析,探索贷款金额的分布情况

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     100    3000    4107    8516    7000  500000

  • 借款金额均值为8517,中值为4107,而50%的借款金额是处于3000-7000之间。 最高的借款金额为500000.说明拍拍贷业务更多的是小额贷款。
  • 取3000-7000之间贷款数据分析,发现整数贷款的的人数存在显著差异。 3000,4000,5000等整额贷款人数明显偏高。可能是因为用户贷款习惯, 也可能是贷款产品导致,原因需要具体分析。
  • 从整体的数据也可以看出整数贷款异常高的现象。
##  [1] "ListingId"        "借款金额"         "借款期限"        
##  [4] "借款利率"         "借款成功日期"     "初始评级"        
##  [7] "借款类型"         "是否首标"         "年龄"            
## [10] "性别"             "手机认证"         "户口认证"        
## [13] "视频认证"         "学历认证"         "征信认证"        
## [16] "淘宝认证"         "历史成功借款次数" "历史成功借款金额"
## [19] "总待还本金"       "历史正常还款期数" "历史逾期还款期数"
## [22] "我的投资金额"     "当前到期期数"     "当前还款期数"    
## [25] "已还本金"         "已还利息"         "待还本金"        
## [28] "待还利息"         "标当前逾期天数"   "标当前状态"      
## [31] "上次还款日期"     "上次还款本金"     "上次还款利息"    
## [34] "下次计划还款日期" "下次计划还款本金" "下次计划还款利息"
## [37] "recorddate"

借款期限进行分布分析

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1.00    6.00   12.00   10.19   12.00   24.00

  • 从借款期限来看,最低的借款期限是1个月,最高的借款期限是24个月。
  • 借款期限均值为10.12.中位数为12,说明借款期限为12月的数量最多。
  • 借款期限数量比较多的其次是6个月。
  • 大部分借款期限集中在6-12个月。
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    7.00   16.00   18.00   17.78   20.00   24.00
## 
##     7     8  8.01  8.09   8.1  8.18  8.39   8.4   8.5  8.51  8.53  8.61 
##    10    10     5    10     5     5     5     5   166     5     5     5 
##   8.7     9  9.01  9.02  9.03   9.1  9.11  9.22  9.25  9.28   9.3  9.31 
##     5   698    31     5    20    10     5     5   101     5    20    10 
##  9.32  9.35  9.38  9.39   9.4  9.45   9.5  9.51  9.53  9.58   9.6  9.61 
##     5    10    10     5     5     5   527    25     5     5    15     5 
##  9.68   9.7  9.71  9.75  9.79  9.88  9.89   9.9    10 10.01 10.02  10.1 
##     5    10     5     5     5    10     5     5  2413     5     5     5 
##  10.5    11  11.5    12    13    14  14.4 14.57  14.6 14.96    15  15.1 
##  6278  6163  7885 22290   744  3335    40    10    15     5  1351    51 
## 15.29    16    17    18 18.01  18.3    19    20  20.5    21    22    23 
##    10 28410   113 97519     5     6   162 66372     7   357 45409   110 
##    24 
##  1641

  • 从借款利率的分布来看,借款利率存在多种种类,最低的利率为7,最高的利率为24
  • 利率的平均值为17.78,中位数为18。
  • 利率的中间50%集中在16-20之间,而借款比较多的几笔利率为18,20,24这三种利率

对初始评级进行分布分析

## 
##      A     AA    AAA      B      C      D      E      F 
##  27913  45663   1322 101487  90140  22591   3157    266

对历史成功借款次数进行分布分析

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1.00    2.00   25.00   24.43   41.00   83.00
## 
##     1     2     3     4     5     6     7     8     9    10    11    12 
## 71102 62843  2218     5     5     5  1491     5  1005     5   759     5 
##    13    14    15    16    17    18    19    20    21    22    23    24 
##   552     5     5   400     5   346     5   227     5     5   131   131 
##    25    26    27    28    29    30    31    32    33    34    35    36 
## 48137    70     5    57    54    56    38     5     5    38     5    58 
##    37    38    39    40    41    42    43    44    45    46    47    48 
##    25    30     3     5 35267    17    10    13     1     5    13     5 
##    49    50    51    52    53    54    55    56    57    58    59    60 
##     4     3 23844    10     5    10     5     5     5    15     5    10 
##    61    62    63    64    65    66    67    68    69    70    71    72 
## 16255    15    10    15     5     5 11063     5    10    10     5    10 
##    73    74    75    76    77    78    79    80    81    82    83 
##     5     5     5  7075    10     5  4664     5     5  3041  1203

  • 最少的借款次数是1次,最多的次数是83次,而历史借款次数最多数量是25次。
  • 从图二可以看出大部分借款次数比较集中,可以考虑集中查看原因。
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       1       3    7180    7878   14717   19185

  • 历史成功借款金额最高为19185,平均值为7878,中位数为7180,从图形可以看出,众数在11250.
  • 历史借款金额主要集中挂在10000元以上
  • 历史借款金额存在着明显的集中情况
## 'data.frame':    292539 obs. of  37 variables:
##  $ ListingId       : int  1693100 1713229 1904026 2158281 2257194 2272036 2315058 2332817 2365175 2370723 ...
##  $ 借款金额        : int  3629 3000 3629 3919 14000 40000 3200 3000 4260 11987 ...
##  $ 借款期限        : int  6 12 12 12 12 6 3 6 7 12 ...
##  $ 借款利率        : num  12 12 12 18 18 15 10 12 12 16 ...
##  $ 借款成功日期    : Factor w/ 654 levels "2015/1/1","2015/1/10",..: 21 24 90 98 108 114 114 150 150 151 ...
##  $ 初始评级        : Factor w/ 8 levels "A","AA","AAA",..: 2 2 2 5 5 4 2 2 2 4 ...
##  $ 借款类型        : Factor w/ 5 levels "APP闪电","电商",..: 3 3 3 3 3 2 3 3 3 4 ...
##  $ 是否首标        : Factor w/ 2 levels "否","是": 1 2 1 1 1 2 1 2 1 1 ...
##  $ 年龄            : int  31 24 27 28 46 32 25 38 25 33 ...
##  $ 性别            : Factor w/ 2 levels "男","女": 1 1 1 1 1 1 1 1 1 2 ...
##  $ 手机认证        : Factor w/ 5 levels "成功认证","其他",..: 1 1 1 1 1 1 1 1 1 3 ...
##  $ 户口认证        : Factor w/ 9 levels "本科","成功认证",..: 6 6 6 2 6 2 6 6 6 6 ...
##  $ 视频认证        : Factor w/ 2 levels "成功认证","未成功认证": 2 2 2 2 2 1 2 2 1 2 ...
##  $ 学历认证        : Factor w/ 2 levels "成功认证","未成功认证": 2 2 2 2 2 2 2 2 1 1 ...
##  $ 征信认证        : Factor w/ 2 levels "成功认证","未成功认证": 2 2 2 2 2 2 2 2 2 2 ...
##  $ 淘宝认证        : Factor w/ 2 levels "成功认证","未成功认证": 2 2 2 2 2 2 2 2 2 2 ...
##  $ 历史成功借款次数: num  2 1 2 51 7 1 41 1 2 41 ...
##  $ 历史成功借款金额: num  10834 1 10834 2900 15316 ...
##  $ 总待还本金      : num  1313 0 879 6523 11491 ...
##  $ 历史正常还款期数: int  2 0 5 25 53 0 8 0 3 8 ...
##  $ 历史逾期还款期数: int  2 0 0 0 0 0 0 0 0 1 ...
##  $ 我的投资金额    : int  200 500 500 100 100 206 400 51 51 100 ...
##  $ 当前到期期数    : int  6 12 12 12 12 6 3 6 7 12 ...
##  $ 当前还款期数    : int  6 9 12 2 0 6 3 6 4 9 ...
##  $ 已还本金        : num  200 500 500 100 0 206 400 51 51 100 ...
##  $ 已还利息        : num  7 29.8 33.04 1.72 0 ...
##  $ 待还本金        : num  0 0 0 0 100 0 0 0 0 0 ...
##  $ 待还利息        : num  0 0 0 0 9.92 0 0 0 0 0 ...
##  $ 标当前逾期天数  : int  0 0 0 0 589 0 0 0 0 0 ...
##  $ 标当前状态      : Factor w/ 234 levels "0","0.03","0.05",..: 232 232 232 232 233 232 232 232 232 232 ...
##  $ 上次还款日期    : Factor w/ 792 levels "0","1","10","11",..: 259 36 510 188 792 45 247 83 296 345 ...
##  $ 上次还款本金    : Factor w/ 4138 levels "0","0.05","0.07",..: 2343 1140 2896 4096 4138 2422 689 3868 2005 2405 ...
##  $ 上次还款利息    : Factor w/ 409 levels "0","0.01","0.02",..: 31 106 39 23 409 43 112 6 1 19 ...
##  $ 下次计划还款日期: Factor w/ 1025 levels "0.92","0.93",..: 1025 1025 1025 1025 154 1025 1025 1025 1025 1025 ...
##  $ 下次计划还款本金: Factor w/ 2054 levels "0","0.01","0.02",..: 2054 2054 2054 2054 1826 2054 2054 2054 2054 2054 ...
##  $ 下次计划还款利息: Factor w/ 355 levels "0","0.01","0.02",..: 355 355 355 355 151 355 355 355 355 355 ...
##  $ recorddate      : Factor w/ 201 levels "0","0.94","1.27",..: 33 33 33 33 33 33 33 33 33 33 ...
## 
##      1      2      3      6      7      8      9     10     11     12 
##     55     30   3560  77702   4292   3276   8774   6452   7573 174636 
##     14     15     17     18     20     24 
##     10    215      5   3416     25   2518
## 
##     男     女 
## 190366 102173
## 
##     否     是 
## 221107  71432
## 
##       0       1       2       3       4 
## 1560671 1391092  212628   37805    1080
## 
##          0       0.03       0.05       0.06       0.07       0.08 
##        409          1          1          1          2          1 
##       0.09       0.11       0.12       0.13        0.2       0.21 
##         10          4          5          2          1          1 
##       0.23       0.29       0.32       0.33       0.34       0.35 
##          1          1          1          2          5          4 
##       0.37       0.38        0.4       0.42       0.44       0.46 
##          1         18         16          4          2          1 
##       0.47       0.48       0.49       0.53       0.55       0.61 
##          1          1          2          1          1          9 
##       0.62       0.64       0.68        0.7       0.73       0.75 
##          2          1          3         25          2          1 
##       0.76       0.77       0.82       0.83       0.84       0.85 
##          7         20          2          1          2          1 
##       0.86       0.87       0.93       0.94       0.99          1 
##          2          1          2          5          1          1 
##       1.03       1.04       1.07        1.1       1.12       1.15 
##          1          1         18          1          1          2 
##       1.16       1.17       1.24       1.25       1.27       1.33 
##          8          2          2          1         11         10 
##       1.35       1.38       1.39       1.41       1.44       1.45 
##          1          1          1          1          1          1 
##       1.47       1.51       1.54       1.55       1.56       1.57 
##          1         11          1          1          1          1 
##       1.58       1.61       1.62       1.63       1.64       1.68 
##          2          1          2          3          6          2 
##       1.71       1.74       1.76       1.78        1.8       1.83 
##          4          1          2         12          1          5 
##       1.84        1.9       1.91       1.92       1.94      10.11 
##         10         13          1          2          1          1 
##      11.11      11.13      12.34      14.37      16.55       2.01 
##          1          1          3          1          2          1 
##       2.02       2.08       2.12       2.16       2.17       2.18 
##          2         10          2          7          1          1 
##       2.19       2.21       2.24       2.27       2.29        2.3 
##          3          1          3          2          4          3 
##       2.31       2.34       2.35       2.39       2.46       2.55 
##          1          6         24          1          2          3 
##       2.59        2.6       2.62       2.63       2.65       2.66 
##          4          3          1          1         16          1 
##       2.67       2.73       2.78       2.82       2.91       2.92 
##          2          2          2          2          3         21 
##       2.94       2.95       3.01       3.06       3.08       3.09 
##          1          4          2          2          3          1 
##        3.1       3.14       3.15       3.18       3.24       3.25 
##          1          1          2          3          1          3 
##       3.26       3.27       3.33       3.38       3.39       3.41 
##          1          1          2          1          3          2 
##       3.42       3.46       3.52       3.53       3.54       3.55 
##          7          1          1          1          8          1 
##       3.56       3.61       3.68       3.76       3.78       3.82 
##         26          4          2          1          1          3 
##       3.85       3.87       3.94       3.96       3.97       3.98 
##          1          1          1          1          1          1 
##      37.59       4.03       4.06        4.2       4.21       4.25 
##          1          2          3          2          1         24 
##       4.27       4.29       4.31       4.34       4.37       4.39 
##          1          1          1          1          1         14 
##       4.43       4.46       4.47       4.49       4.52       4.61 
##          7          1          1          1          1          2 
##       4.69       4.73       4.83       4.84        4.9       4.92 
##          1          2         18          2          1          1 
##       4.93          5        5.1       5.14       5.16       5.21 
##          2         26          1          2          1          1 
##       5.24       5.31       5.33       5.41       5.44        5.5 
##          1          1          6          1          2          2 
##       5.53       5.65       5.69       5.73       5.75       5.76 
##          1          1          1          1          1         25 
##       5.79        5.8       5.81       5.92       5.96       6.14 
##          1          2          2          1          1          1 
##       6.15        6.2       6.27       6.43       6.47       6.77 
##          2          1          7          1         12          8 
##       7.12       7.13       7.14       7.15       7.18        7.2 
##          1          1          3          1          1          2 
##       7.32       7.38        7.7       8.03       8.26       8.31 
##          2          1          2          1          1          1 
##       8.73       9.02       9.67     已还清     逾期中 正常还款中 
##          2          1          2     109168       9599     172569
## 
##      0      1      2      3      4      5      6      7      8      9 
## 282147   1090    439    380    411    252    176    136    137    107 
##     10     11     12     13     14     15     16     17     18     19 
##    102     95     73     91     72     65     74    138     67     67 
##     20     21     22     23     24     25     26     27     28     29 
##     60     65     92     69     42     63     73     36     39     31 
##     30     31     32     33     34     35     36     37     38     39 
##     68     40     59     55    105     51     53     51     76     41 
##     40     41     42     43     44     45     46     47     48     49 
##     36     50     92     34     40     39     83     46     35     36 
##     50     51     52     53     54     55     56     57     58     59 
##    129     52     35     45     37     44     17     21     48     27 
##     60     61     62     63     64     65     66     67     68     69 
##     29     37     21     30     30     46     43     30     31     30 
##     70     71     72     73     74     75     76     77     78     79 
##     19     23     26     22     26     24     40     33     25     35 
##     80     81     82     83     84     85     86     87     88     89 
##     28     22     22     28     26     33     29     19     15     19 
##     90     91     92     93     94     95     96     97     98     99 
##     26     24     25     33     15     39     31     43     21     24 
##    100    101    102    103    104    105    106    107    108    109 
##     23     19     18     32     14     22     26     28     28     25 
##    110    111    112    113    114    115    116    117    118    119 
##     31     29     20     17     18     20     24     20     20     12 
##    120    121    122    123    124    125    126    127    128    129 
##     20     20     21     12     21     17     30     30     23     23 
##    130    131    132    133    134    135    136    137    138    139 
##     19     17     10     17     16     13     15     21     18     17 
##    140    141    142    143    144    145    146    147    148    149 
##     26     20     17     22     17     19     16     11     21     15 
##    150    151    152    153    154    155    156    157    158    159 
##     15     17     19     14     16     17     27     15     24     12 
##    160    161    162    163    164    165    166    167    168    169 
##     16     14     12      9     15      4     16     19     12     14 
##    170    171    172    173    174    175    176    177    178    179 
##     20     25     14     12     15     15     13     17     11     15 
##    180    181    182    183    184    185    186    187    188    189 
##      9     16     14      8     12     20     12     20     15     12 
##    190    191    192    193    194    195    196    197    198    199 
##      9      8     10      8      9      5      6      7      8      7 
##    200    201    202    203    204    205    206    207    208    209 
##     10     14      9      8      7     14      8     13     10     13 
##    210    211    212    213    214    215    216    217    218    219 
##      7     12      8      3      8      7     11     15      4     14 
##    220    221    222    223    224    225    226    227    228    229 
##     11     10      6      8      5      9     10      4      7      6 
##    230    231    232    233    234    235    236    237    238    239 
##     15      8      9      7      7     12      8     12     12      4 
##    240    241    242    243    244    245    246    247    248    249 
##     11      9      6      6      6      8     12      7     11      3 
##    250    251    252    253    254    255    256    257    258    259 
##      6      5      4      8      5      4      6      4      3      9 
##    260    261    262    263    264    265    266    267    268    269 
##     11      4      5      7      6      3      3      7     13      9 
##    270    271    272    273    275    276    277    278    279    280 
##      6      4      5      3      3      6      3      7      7      7 
##    281    282    283    284    285    286    287    288    289    290 
##      1      5      4      3      7      2      5      1      4      7 
##    291    292    293    294    295    296    297    298    299    300 
##      5      3      4      6      2      6      5      1     10     10 
##    301    302    303    304    305    306    307    308    309    310 
##      5      4      2      3      3      6      5      4      4      3 
##    311    312    313    314    315    316    317    318    319    320 
##      3      2      1      4      6      3      3      4      3      4 
##    321    322    323    324    325    326    327    328    329    330 
##      6      3      4      4      8      5      6      5      3      7 
##    331    332    333    335    336    337    338    339    340    341 
##      5      1      3      1      2      5      5      5      2      5 
##    342    343    344    345    346    347    348    349    350    351 
##      3      2      2      1      8      2      4      3      5      5 
##    352    353    354    355    356    357    358    359    360    361 
##      4      4      2      5      8      1      4      2      4      8 
##    362    363    364    365    366    367    368    369    370    371 
##      5      1      4      3      1      4      6      5      1      3 
##    372    373    374    375    376    377    378    379    380    381 
##      3      1      2      3      2      6      3      5      3      3 
##    382    383    384    385    386    387    388    389    390    392 
##      6      2      5      4     12      7      2      6      1      8 
##    393    394    395    396    397    398    399    400    401    402 
##      3      3      3      4      1      5      4      5      1      3 
##    403    405    406    407    408    409    410    411    412    413 
##      1      4      1      4      2      5      5      7      1      5 
##    414    415    416    417    418    419    420    421    422    423 
##      4      1      3     10      2      5      4      2      2      5 
##    424    425    426    427    428    429    430    431    432    433 
##      2      5      2      1      1      4      4      4      1      3 
##    434    436    437    438    439    440    441    442    443    444 
##      1      5      3      2      1      4      4      3      6      3 
##    445    446    447    448    449    450    451    452    453    454 
##      6      2      4      5      1      3      2      1      4      3 
##    455    456    457    458    459    460    461    462    463    464 
##      1      2      4      3      5      3      4      3      2      1 
##    466    467    468    469    470    471    472    474    475    476 
##      4      1      3      2      2      2      3      5      3      7 
##    477    478    479    480    481    482    484    485    486    488 
##      3      3      2      2      1      2      4      4      1      2 
##    489    490    492    493    494    496    497    498    499    500 
##      2      3      1      1      2      1      4      3      2      2 
##    501    503    504    505    506    507    508    509    511    512 
##      3      1      2      3      4      2      2      3      2      2 
##    513    515    516    518    519    520    521    522    523    525 
##      2      2      4      1      4      4      2      1      1      1 
##    526    527    528    529    530    531    533    534    535    537 
##      1      1      2      2      2      2      3      1      2      5 
##    538    539    540    542    543    544    545    546    550    551 
##      1      1      1      1      2      2      1      2      1      3 
##    553    554    556    557    558    560    561    562    564    565 
##      1      1      2      1      1      1      2      1      1      2 
##    566    567    568    570    572    577    578    580    584    588 
##      1      3      1      2      1      2      1      1      1      3 
##    589    591    592    596    598    601    609    610    613    622 
##      1      1      1      3      1      2      1      2      1      1 
##    625    636    647    648    651    655    657    660    681 
##      1      2      1      1      1      1      1      1      1

Univariate Analysis

What is the structure of your dataset?

本数据集中主要包含3和数据集,其中lcis包含lc中的所有字段,因此主要是对lcis进行分析,在lcis中有37个字段,1个主键,其中12个市连续变量,其他的均为分类变量。

What is/are the main feature(s) of interest in your dataset?

借款金额,年龄,标当前逾期天数,标当前状态

What other features in the dataset do you think will help support your investigation into your feature(s) of interest?

历史成功还款期数,历史逾期还款天数,初始评级,借款金额,是否首标

Did you create any new variables from existing variables in the dataset?

没有

Of the features you investigated, were there any unusual distributions? Did you perform any operations on the data to tidy, adjust, or change the form of the data? If so, why did you do this?

对于借款金额而言,75%分位是7000元,而最高借款金额是500000,而超过7000的借款人数仅为少数,这样少数的数据拉高了整体数据的平均值。结合日常情况,我们分别对2500-7500的借款金额进行分析,然后针对10000-500000的借款进行进行分布分析,发现10000以上的借款人数都低于3000人。 对借款金额根据金额进行拆分,是因为符合我们平时对于普通大众和有钱人的区分,他们借款的金额和目的会出现差异,逾期情况可能也会不同。最重要的是,高额的借款人数过少,说明拍拍贷主要的目标群体是普通大众,因此我们主要对2500-7500元借款的用户进行分析。

Bivariate Plots Section

## lcis$性别: 男
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     100    3000    4000    9386    7000  500000 
## -------------------------------------------------------- 
## lcis$性别: 女
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     100    3000    4275    6896    7000  500000

Bivariate Analysis

Talk about some of the relationships you observed in this part of the investigation. How did the feature(s) of interest vary with other features in the dataset?

  • 男性用户的数量是女性用户数量的两倍所有,而且男女之间用户的年龄特征占比基本一致。
  • 男性和女心用户的最低借款金额,最高借款金额,25%分位借款金额,75%分位借款金额一致,男性的借款金额平均值高于女性,而女性的借款金额中位数高于男性。
  • 借款金额数量最多的借款比率是18%,而14%,16%,20%,22%这几个比率也借款金额也比较高。而借款金额和借款比例之间似乎不存在相关关系
  • 从逾期数量和初始评级之间的关系可以看出,AAA评级的逾期数最少,C级的逾期数最多。而从逾期比例来看,F级的逾期比例最低,其次是AAA即,逾期比例最高的是B级和C级。

Did you observe any interesting relationships between the other features (not the main feature(s) of interest)?

  • 发现借款金额最多用户的是3000元的借款金额,而整数的借款金额,比如4000,5000,6000,7000等借款人数明显高于其他人数。
  • 男性的高额借款比例要高于女性。
  • 使用拍拍贷的男女性别在都趋于年轻化,最要的年纪集中在23-32岁之间。

What was the strongest relationship you found?

  • 借款人数越多,发生逾期的可能性越大。
  • B/C两级发生逾期的可能性更大。
  • 两个变量间的强相关关系尚未发现

Multivariate Plots Section

Multivariate Analysis

Talk about some of the relationships you observed in this part of the investigation. Were there features that strengthened each other in terms of looking at your feature(s) of interest?

  • 从矩阵图形和上面的图形分析,尚未发现与“标当前逾期天数”存在强相关的变量。
  • 无论是年龄,初始评级还是金额都会发生短期的逾期,但是当逾期天数达到300天及以上时,就会出现一定的规律性。
  • 当预期天数达到300天以上时,发现最初评级为C/D的用户更容易长时间逾期。
  • 初始评级越高,借款的利率越低

Were there any interesting or surprising interactions between features?

  • 借款类型不同,可能与借款金额存在一定的相关性,APP闪电的用户更倾向于借款金额2000一下,其他用户集中在2000-3000,而普通用户的借款金额在,3000-4000左右。

OPTIONAL: Did you create any models with your dataset? Discuss the strengths and limitations of your model.

  • 没有模型,探索性分析过程中,没有发现强相关关系,可能需要对变量以及对变量的定义进行深入的研究。

Final Plots and Summary

Plot One

1

1

Description One

  • 从单边量分析借款金额,可以看出,借款金额最低100元,最高50万不等。
  • 从第一幅图可以看出,借款金额属于长尾型数据,头部借款人数比较多,而尾部很长一段,借款金额都比较少
  • 我们对借款金额进行summary统计,发现:中位数4107,平均值为8516,而75%分位为7000。
  • 我们对借款金额进行子集化处理后,jjieku借款金额越大,借款人数大体一次减少,而整体的借款数,如3000,4000,5000,6000,7000借款人数最多。
  • 3000金额的借款人数最多,达到25000人,而超过10000的借款金额,借款最多的人数只有2000人。

Plot Two

2

2

Description Two

  • 对借款金额和性别进行分组统计,发现除了平均值和中位数不同外,其他基本一致。
  • 而目前女性用户的数量仅是男性用户的一半,在中间50%范围内,女性和男性的金钱使用水平基本一致。
  • 后期我们可以针对这部分女性用户进行关注和拉新,从而提高我们的借款流水总额。

Plot Three

3

3

4

4

5

5

Description Three

  • 从关系矩形图可以看出,标当前逾期天数和其他的变量之间相关性较弱,没有发现很强的相关性。
  • 从借款金额&标当前逾期天数&借款类型图形可以看出,每种不同的借款类型的借款金额会表现出不同。
  • APP闪电的用户更倾向于借款金额2000一下,其他用户集中在2000-3000,而普通用户的借款金额在,3000-4000左右。
  • 其他和普通类型的借款用户会更容易出现超过300天的逾期现象。
  • 初级评级等级越高,利率越低,初级评级等级越低,利率越高。

Reflection

用户特征

1、从性别来看,男性用户是女性用户的2倍,而在中间50%的用户水平女性和男性的借款水平基本一致。—后期我们如需要增加用户量或者业务量,女性可能是一个突破口,尤其是中间部分的女性。 2、从年龄来看,拍拍贷的使用用户去年年轻化,最主要的使用年龄处于23-32岁之间。—年轻化是互联网金融的一种趋势,但是年轻一代的偿债能力有待考量,这也可能是逾期比较多的原因之一。后期我们可能在维持年轻人用户的基础上,更多的拓宽用户年龄段。尤其是40岁左右经济实力可以,另外又有借款需求的中年用户。

业务现状

1、针对逾期情况:尚未发现与标当前逾期天数强相关的变量,尤其是初始评级相关性比较低,说明我们在最初评级的标准可能需要重新考量,而且对我们借款及中间用户风险的把控,可能需要进一步的梳理。尤其是对于用户的评级标准需要细化。 2、关于利率&借款金额:我们发现借款利率与借款金额无明显的关系,而我们的借款主要可能用于大众的小额借款和大额的创业贷款,而这两种业务可以分开指定不同的策略。 3、针对不同的借款类型可以和上一条相结合,进行业务统一标准化。 4、初级评级等级越高,利率越低,初级评级等级越低,利率越高。

意见

针对目前的业务状况,各数据间的相关关系很弱,除了初级等级评价与利率之间有明显相关之外,对于逾期变量,灭有明显变量可以预测客户逾期的可能性,因此后期需要深度挖掘逾期的相关变量,后期能够很好的预测用户的逾期可能性。重点关注,历史逾期情况、借款用途、借款金额、用户评级等变量。